"""
RAG Embeddings项目配置文件

该文件包含了项目的所有核心配置参数，包括：
- 文档处理相关配置
- 大模型服务配置  
- 向量数据库配置
- 嵌入模型配置
"""
import os


class Config:
    """项目配置类，包含所有配置参数"""
    
    # ==================== 文档处理配置 ====================
    CHUNK_SIZE = 512  # 文本分块大小（字符数）
    CHUNK_OVERLAP = 20  # 相邻文本块重叠字符数
    MIN_LINE_LENGTH = 10  # 最小行长度（用于过滤短行）

    # ==================== Ollama大模型配置 ====================
    OLLAMA_BASE_URL = "http://172.16.8.136:11434"  # Ollama服务地址
    OLLAMA_MODEL = "qwen2.5:7b"  # 使用的大模型名称

    # ==================== 文档路径配置 ====================
    PDF_PATH = 'docs/新型医疗器械产品市场准入路线探讨_2021.pdf'  # PDF文档路径

    # ==================== 向量化模型配置 ====================
    EMBEDDING_MODEL = "BAAI/bge-small-zh-v1.5"  # 中文嵌入模型

    # ==================== 向量数据库配置 ====================
    CHROMA_DB_PATH = r"vector_db/chroma"  # Chroma数据库持久化存储路径
    COLLECTION_NAME = "rag_documents"  # Chroma数据库集合名称